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@) ^ROCEDE ET DISPOSITIF DE CORRECTION CENTRALISEE DU TIMBRE DE LA PAROLE SUR UN RESEAU 
DE COMMUNICATIONS TELEPHONIQUES. 



L'invention concerne un procede et dispositif de cor- 
rection du timbre de la parole transmise sous la forme d'un 
signal an moyen d'une liaison de transmission d'un reseau 
telephonique. 

La correction ayant lieu apres la conversion analogique- 
numerique du signal dans le reseau, et comprend une pre- 
egalisation (23) du signal numerique par un filtre fixe ayant 
une reponse frequentielle dans une bande de frequences 
I c-Fh correspondant a ('inverse d'une deformation spectra- 
le de reference Introduite par la liaison telephonique. avec 
Fc < 300Hz et Fh > 31 50Hz et une egalisation adapte'e (24) 
dans laquelle on utilise un filtre ayant une reponse frequen- 
tielle adaptee automatiquement a la distorsion reelle intro- 
duite par la liaison telephonique en fonction du rapport entre 
un spectre de reverence et un spectre correspondant au 
spsstre a long terme du signal. 
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PROCEDE ET DISPOSITIF DE CORRECTION CENTRALI SEE DU 
TIMBRE DE LA PAROLE SUR UN RESEAU DE COMMUNICATIONS 

TELEPHONIQUES 

L' invention a pour objet un procede et un 
dispositif de correction centralisee du timbre de la 
parole sur un reseau de communications telephoniques . 

L' invention s'applique a tout type de reseau de 
communication (fixe, mobile ou autre) introduisant des 
deformations spectrales et des modifications du niveau 
du signal, moyennant le choix approprie de certains 
parametres . 

Dans le cas d'un reseau telephonique filaire, la 
parole subit deux distorsions spectrales. 

La premiere distorsion est le filtrage passe-bande 
(300-3400Hz) aux extremites de chaque ligne analogique 
d'abonne (terminal telephonique emetteur 
respect ivement recepteur - et point de conversion 
analogique -numerique - respectivement numerique- 
analogique) , normalise sous le nom de « Systeme de 
Reference Intermediate » (SRI) que 1 ' on trouve defini 
par la recommandation p4 8 de l'UIT. . 

On pourra se reporter aux figures la et lb 
representant ies reponses f requentielles des systemes 
d' emission et de reception definis par l'UIT. 

Ce filtrage passe-bande degrade le timbre en 
attenuant fortement les composantes basse- frequence de 
la parole. 

La deuxieme distorsion est celle introduite par les 
lignes analogiques elles-memes, qui constituent des 
filtres passe-bas dont la pente est d'autant plus raide 
que la ligne est longue. Dans un modele simple de ligne 
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analogique, 1 ' attenuation en dB est proportionnelle a 
la racine carree de la frequence : 

H dB (f) = H dB (m Hz)^4r (1) 

5 

avec HdB(800Hz), valant 3 dB pour les lignes moyennes et 
9,5 dB pour les lignes les plus longues . 

Les reponses f requentielles de differentes lignes 
(courte, moyenne et longue) sont representees sur la 
10 figure 2. 

Ce filtrage passe-bas a pour effet d'assourdir la 
voix du locuteur. 

Dans le cas d'un reseau mobile, le signal subit 
uniquement un filtrage passe-bande 300-3400Hz au niveau 
15 des terminaux emetteur et recepteur. Ce filtrage passe 
bande doit respecter un gabarit defini par la 
recommandation P. 313 de l'UIT. 

Jusqu'a present la compensation des distorsions 
spectrales introduites dans le signal de parole par les 
20 divers elements de la liaison telephonique est realisee 
par des dispositifs a base d' egalisation . Celle-ci peut 
etre fixe ou s' adapter en fonction des conditions de 
transmission. 

25 Un premier etat de la technique concerne les 

dispositifs d' egalisation fixe centralisee. 

En effet, des dispositifs d' egalisation centralisee 
ont ete proposes dans les brevets US 5333195 et 
US 5471527. 

30 Ces egaliseurs sont des. filtres fixes qui 

restaurent le niveau des basses frequences attenuees 
par 1' emetteur. Le brevet US 5333195 propose par 
exemple un gain de 10 a 15 dB sur la bande 100-300Hz. 
Ces methodes presentent deux inconvenients : 
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- l'egaliseur ne compense que le filtrage de 
l'emetteur, de sorte qu'a la reception les 
composantes basse- frequence restent fortement 
affaiblies par le filtrage SRI de reception, 

- Cette egalisation fixe compense des conditions 
de transmission (ligne et systeme d' emission) 
moyennes. Si les conditions reelles sont trop 
differentes (par exemple si les lignes 
analogiques sont longues) le dispositif ne 
corrige pas suffisamment le timbre, voire 
l'altere plus que la liaison sans egalisation. 

Un deuxieme etat de la technique repose sur des 
dispositif s a egalisation adaptative. 

Le dispositif decrit dans le brevet US 5915235 vise 
a corriger la reponse f requentielle non ideale d'un 
transducteur de telephone mobile. L'egaliseur est 
decrit comme etant place entre un convertisseur 
analogique-numerique et un codeur CELP (Code Exited 
Linear Predictive Coding) , mais peut etre aussi bien 
dans le terminal telephonique que dans le reseau. 

Deux methodes sont alors proposees dans ce 
document : 

- La premiere consiste a calculer les coefficients 
d' auto-correlation a long terme R LT : 

R L T(n,i)=aR LT (n-l,i) + (l-a)R(n,i) , (2) 

_Avec : R LT (n,i) i idme coefficient d' auto-correlation a 
long terme a la n idrae trame, R(n,i) i i6me coefficient 
d' auto-correlation specif ique a la n iSme trame, et a 
constante de lissage fixee par exemple a 0,995. De ces 
coefficients sont derives les coefficients LPC (Linear 
Predictive Coding) a long terme, qui sont les 



2822999 



coefficients d'.un filtre blanchisseur . A la sortie de 
ce filtre, le signal est filtre par un filtre fixe qui 
lui ■ imprime les caracteristiques spectrales a long 
terme ideales, c'est-a-dire celles qu'il aurait a la 
sortie d'un transducteur ayant la reponse frequentielle 
ideale. Ces deux filtres sont completes par un gain 
multiplicatif egal au rapport entre les energies a long 
terme de 1' entree du filtre blanchisseur et la sortie 
du deuxieme filtre. 

- La deuxieme methode consiste a diviser le signal 
en sous-bandes et, pour chaque sous-bande, appliquer un 
gain multiplicatif de maniere a atteindre une energie 
cible, ce gain etant defini comme le rapport entre 
1' energie cible de la sous-bande et 1' energie a long 
terme (obtenue par un lissage de 1' energie instantanee) 
du signal dans cette sous-bande. 

Ces deux methodes presentent 1 ' inconvenient de ne 
corriger que la reponse non ideale du systeme 
d' emission et non celle du systeme de reception. 

Le dispositif decrit dans le brevet FR 94 08741 
(US 5905969) a pour objet de compenser le filtrage du 
systeme d' emission et de la ligne d'abonne d' emission 
pour ameliorer la reconnaissance central isee de la 
parole et/ou la qualite de la parole transmise . Comme 
le represente la figure 3a de ce brevet, le spectre du 
signal est divise en 24 sous-bandes et chaque energie 
de sous-bande est multipliee par un gain adaptatif. Une 
adaptation du gain est realisee selon l'algorithme du 
gradient stochastique, par minimisation de l'erreur 
quadratique, l'erreur etant definie comme la difference 
entre 1' energie de sous-bande et une energie de 
reference ddfinie pour chaque sous-bande. L' energie de 
reference est modulee a chaque trame par 1' energie 
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globale de la trame courante, de maniere a respecter 
les variations naturelles de niveau a court terme du 
signal de parole. La convergence de l y algorithrae perrnet 
d'obtenir en sortie les 24 signaux de sous-bande 
5 egalises. 

Le dispositif ne corrige pas le filtrage du systeme 
de reception et de la ligne analogique de reception. 

Ce brevet ne mentionne pas de resultats en termes 
d' amelioration de la qualite vocale et reconnait que la 
10 methode est sous-optimale, car on opere une 
transformation dans le domaine frequentiel avec une 
erreur due a 1' operation de convolution circulaire 
implicite liee a cette transformation. 

En outre, il y a une oscillation du systeme autour 
15 de la solution optimale liee au fait que la correction 
est realisee par un algorithme adaptatif en boucle 
fermee (boucle de retroaction) . 

Une compensation de 1'effet de ligne est decrite 
20 dans 1' article « On line adaptation of a speech 
recognizer to variation in telephone lines 
conditions », Eurospeech, pp 1247-1250, sept. 1993 de 
C.Mokbel, J.Monne and D. Jouvet par la methode de la 
soustraction cepstrale, dans le but d'ameliorer la 
25 robustesse de la reconnaissance de la parole. 

On montre dans ce document que le cepstre du canal 
de transmission peut etre estime par le cepstre moyen 
du signal regu, celui-ci etant prealablement blanchi 
par un filtre de pre-accentuation . 
30 Cette methode perrnet une nette amelioration des 

performances des systemes de reconnaissance de la 
parole, mais est consideree comme une methode « off- 
line », 2 a 4 secondes etant necessaires pour estimer 
le cepstre moyen. Elle ne peut pas par consequent 
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s'appliquer a la correction des distorsions sur la 
parole introduites par le canal de transmission d'un 
reseau telephonique. 

5 La presente invention a pour but 1 7 amelioration de 

la qualite de la parole transmise sur les reseaux de 
communication, en offrant des moyens pour corriger les 
deformations spectrales du signal de parole et les 
ecarts de niveau par rapport au niveau nominal 
10 souhaitable pour la perception de la parole, 
deformations et ecarts provoques par differents 
maillons de la chaine de transmission. 

L' invention a plus particulierement pour objet un 

15 procede de correction du timbre de la parole transmise 
sous la forme d'un signal au moyen d'une liaison de 
transmission d'un reseau telephonique, la correction 
ayant lieu apres la conversion analogique-numerique du 
signal dans le reseau, principalement caracterise en ce 

20 qu'il comprend au moins une etape de pre-egalisation du 
signal numerique par un filtre fixe ayant une reponse 
f requentielle dans une bande de frequences Fc-Fh 
correspondant a 1' inverse d'une deformation spectrale 
de reference introduite par la liaison de transmission, 

25 avec Fc < 300Hz et Fh > 3150Hz. 

Selon une autre caracteristique, la deformation 
spectrale prise comme reference est caracterisee, dans 
le cas d'une liaison d'un reseau de telephonie commutee 
(RTC) , a partir de la mise en cascade d'un systeme de 

30 reference intermediaire (SRI) du type defini par la 
recommandation UIT-T P. 48, et de deux lignes 
analogiques moyennes (emission et reception) . 

Dans le cas ou le terminal emetteur est un 
telephone mobile et le terminal recepteur est un poste 
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fixe, la deformation spectrale prise comme reference 
est celle resultant de la mise en cascade d'un filtre 
respectant le gabarit d' ef f icacite des mobiles en 
emission defini par la recommandation P. 313 de l'UIT, 
5 d'une ligne .■ andlogique moyenne et d'un systeme 
recepteur du SRI tel que defini par la recommandation 
UIT-TP.48. 

Dans le cas ou le terminal emetteur est un poste 
fixe et le terminal recepteur est un telephone mobile, 

10 la reponse spectrale prise comme reference est celle 
resultant de la mise en cascade d'un systeme emetteur 
du SRI tel que defini par la recommandation UIT-TP.48, 
d'une ligne analogique moyenne et d'un filtre 
respectant le gabarit d'eff icacite des mobiles en 

15 reception defini par la recommandation P. 313 de l'UIT. 

Dans le cas d'une liaison entre terminaux mobiles, 
la deformation spectrale prise comme reference est, 
celle resultant de la mise en cascade d'un filtre 
respectant le gabarit d'efficacite des mobiles en 

20 emission defini par la recommandation P. 313 de l'UIT et 
d'un filtre respectant le gabarit d'efficacite des 
mobiles en reception defini par la recommandation P. 313 
de l'UIT. 

Selon une autre caracteristique, le procede de 
25 correction du timbre de la parole comporte en outre une 
etape d' egalisation adaptee dans laquelle on utilise un 
filtre ayant une reponse f requentielle adaptee 
automat iquement a la distorsion reelle introduite par 
la liaison telephonique en fonction du rapport entre un 
30 spectre de reference et un spectre correspondant au 
spectre a long terme du signal. 

Selon une autre caracteristique, 1' etape 
d' egalisation adaptee comprend : 
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la detection d'une activite vocale sur la ligne 
pour declencher un enchainement de traitements pour le 
calcul des coefficients du filtre numerique en fonction 
du rapport entre le spectre de reference et le spectre 
5 correspondant au spectre a long terme du signal, 

- la commande du filtre avec les coefficients 
obtenus et 1 ' actualisation desdits coefficients, 

- le filtrage du signal sortant du pre-egaliseur 
par ledit filtre. 

10 Selon une autre caracteristique, 1 ' enchainement de 

traitements comprend : 

- le calcul du spectre a long terme du signal dans 
des fenetres temporelles successives se recouvrant 
partiellement, ce calcul etant realise dans la bande de 

15 frequences Fc-Fh, 

- le calcul du module de la reponse frequentielle 
de l'egaliseur adapte en effectuant le rapport de la 
racine carree du spectre a long terme obtenu dans une 
fenetre temporelle, S la racine carree du spectre de 

2 0 reference, la racine carree du spectre de reference 
etant compense a chaque frequence par un facteur 
predetermine A(f j fonction de la frequence. 

Selon une autre caracteristique, 1 ' enchainement de 
traitements comprend une extrapolation du module de la 

25 reponse f requentielle de l'egaliseur adapte, pour les 
frequences en dehors de la bande Fc-Fh, la reponse 
frequentielle etant definie pour toutes les frequences 
comprises entre Q-4000Hz. 

L' enchainement de traitements comprend en outre le 

30 calcul de la reponse impulsionnelle du filtre numerique 
a partir du module de la reponse frequentielle de 
l'egaliseur adapte extrapole pour les frequences en 
dehors de la bande Fc-Fh. 
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Le calcul du spectre du signal a long terme 
comprend une operation de transformee de Fourier 
rapide. 

Le calcul de la reponse impulsionnelle du filtre 
consiste a calctiler les coefficients du filtre en 
operant une transformee de Fourier inverse sur le 
module de la reponse f requentielle, suivie d'une 
symetrisation, d'un fenetrage et d'un decalage. 

L' application d'une fenetre temporelle correspond a 
un lissage de la reponse f requentielle initiale 
calculee . 

Le calcul du spectre a long terme du signal dans 
des fenetres temporelles successives se recouvrant 
partiellement comprend : 

- 1'echantillonnage du signal dans une fenetre 
temporelle, 

- 1' operation de transformee de Fourier rapide 
(FFT) du signal echantillonne, 

- le calcul de la densite spectrale de puissance, 

- le calcul de la moyenne de la densite spectrale 
de puissance, sur une duree predeterminee . 

Avantageusement , le calcul de la moyenne de la 
densite spectrale de puissance consiste : 

- pour les N premieres fenetres temporelles a 
partir de la detection de presence de parole 
dans le signal, a calculer la., moyenne 
arithmetique des densites spectrales de 
puissance de toutes les fenetres temporelles 
ecoulees depuis ladite detection, N etant un 
nombre de fenetre temporelles predetermine, 
typiquement mais non exclusivement le nombre de 
fenetres temporelles dans 4 secondes de parole ; 

- pour les fenetres temporelles suivantes, a 
ajuster la moyenne de la densite spectrale de 
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puissance calculee a la fenetre temporelle 
precedente par un lissage recursif du premier 
ordre tenant compte de la densite spectrale de 
puissance de la fenetre temporelle courante. 
Cela se traduit par la formule generique suivante : 

E[y x (f)] n = ct(n)y x (f,n) + (l-<x(n) )E[y x (f )]„.!• (9) 

ou E[y x (f)] n est le spectre a long terme de x a la n idme 
trame y x (f,n) la densite spectrale de puissance de la 
nieme trame, et 



min(n 9 N) 

Le procede comprend en outre une etape de controle 
automatique du gain. 

Selon un mode de realisation, le controle 
automatique du gain est realise durant 1 ' enchainement 
des traitements de 1' etape d' egalisation en choisissant 
une densite spectrale de reference y ref correspondant au 
niveau souhaite en reception. 

Selon un autre mode de realisation, le controle 
automatique du gain est realise par amplification du 
signal obtenu apres egalisation avec un gain a fonction 
du rapport entre la densite spectrale de puissance du 
signal de sortie du terminal de reception lorsque l'on 
a effectue une pre-egalisation et une egalisation 
adaptee du signal et, la densite spectrale de puissance 
du signal de sortie du terminal de reception en 
1' absence de pre-egalisation et d' egalisation adaptee 
du signal . 

Un autre objet de 1' invent ion" est un filtre 
numerique fixe destine a la correction du timbre de la 
parole dans un reseau de transmission telephonique , 
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principalement caracterise en ce que ledit filtre a une 
reponse f requentielle dans une bande de frequences Fc- 
Fh, ' correspondant a 1' inverse d'une deformation 
spectrale de reference introduite par la liaison, avec 
Fc < 300Hz et Fh 2 3150Hz. 

Un autre objet de 1' invention est un filtre 
numerique adapte destine a la correction du timbre de 
la parole dans un reseau de transmission telephonique, 
principalement caracterise en ce qu'il comprend des 
moyens de traitement du signal de parole ayant une 
reponse f requentielle adaptee automat iquement a la 
distorsion reelle introduite par la liaison 
telephonique en fonction du rapport entre un spectre de 
reference et un spectre correspondant au spectre a long 
terme du signal . 

Un autre objet de 1' invention est un dispositif de 
correction du timbre de la parole dans un reseau de 
transmission telephonique, principalement caracterise 
en ce qu'il comprend un filtre fixe suivi d'un filtre 
adapte et des moyens de controle automat ique du gain 
tels que decrits precedemment . 

D'autres particularity et avantages de 1' invention 
apparaitront clairement a la lecture de la description 
qui est faite ci-apres et qui est donnee a titre 
d'exemple non limitatif et en regard des dessins sur 
lesquels : 

- la figure la represente le gabarit du systeme 
d' emission, 

- la figure lb represente le gabarit du systeme de 
reception, 

- la figure 2 represente les reponses de 
differentes lignes d'abonnes analogiques, 
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- la figure 3 represente une liaison telephonique 
simplifiee incluant la correction, 

- la figure 4 represente le schema f onctionnel 
d'un dispositif de correction, 

La figure ^ represente la reponse f requentielle 
du pre-egaliseur pour Fc=250Hz, 

La figure 6 represente une fenetre triangulaire 
appliquee a la reponse impulsionnelle du filtre, 

- La figure 7 represente le schema fonctionnel de 
l'egaliseur adapt e, 

La figure 8 represente la distorsion spectrale 
entre le signal emis et le signal regu pour un 
locuteur 1 et pour un locuteur 2 . 

15 La description qui en est donnee dans la suite fait 

explicitement reference a la transmission de la parole 
sur lignes telephoniques « classiques » (c ' est-a-dire 
filaires) , mais bien entendu comme cela a ete dit 
1' invention s' applique a tout type de reseau de 

20 communication (fixe, mobile ou autre) introduisant des 
deformations spectrales et des modifications du niveau 
du signal, moyennant le choix approprie de certains 
parametres . 

L' 6b jet de 1' invention est de corriger les 
25 distorsions spectrales par un traitement centralise, 
c' est-a-dire par un dispositif 20 installe dans la 
partie numerique du reseau telephonique entre le 
convert isseur analogique-numerique (loi A dans le cas 
particulier du RTC europeen ou loi ^ aux Etats-Unis) 12 
30 et numerique (loi A) -analogique 32, comme illustre par 
le schema de la figure 3. Le dispositif de correction 
20 est precede par un module 21 de conversion du signal 
numerique (la loi A ) en lineaire et suivi par un 
module de conversion du signal lineaire en loi A. 
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La figure .4 illustre le dispositif de correction 
selon 1 ' invention . 

• Une correction satisf aisante des distorsions 
moyennes dues au systeme emission 10, reception 30 et 
5 aux lignes analog! ques 11, 31 est obtenue par un pre- 
egaliseur 23 . 

Afin de tenir compte du fait que les conditions de 
transmission ne sont pas toujours des conditions 
moyennes de transmission, (les lignes utilisees ne sont 

10 pas toujours de longueur moyenne et les systemes 
d' emission et de reception peuvent s'ecarter des 
recommandations de 1'UIT), le dispositif de correction 
comporte en outre un egaliseur adapte 24 et une 
correction automatique de gain (CAG) 25 . Comme on le 

15 verra dans la suite le controle automatique du gain 
peut etre soit integre a 1' egaliseur adapte, soit faire 
l'objet d'un module separe. 

Le pre-egaliseur 23 est un filtre fixe dont la 
reponse f requentielle sur une bande Fc-Fh, telle que Fc 

20 <.. 300Hz et Fh > 3150Hz, est 1' inverse de la reponse 
globale du canal analogique moyen d'une liaison 
telephonique . Ce canal moyen est defini comme etant 
constitue de deux lignes d'abonne moyennes et d'un 
systeme d' emission et de reception respectant les 

25 reponses f requentieiles nominales definies dans les 
recommandations de l'UIT. 

Fc est la frequence basse limite d' egalisation . 
Elle doit etre inferieure a 300 Hz de maniere a 
restaurer les composantes basse-f requence (BF) de la 

3 0 voix. 

Fh est par exemple a 3150Hz. 

La figure 5 represente la reponse f requentielle 
typique du pre-egaliseur pour Fc=250 Hz. Cette reponse 
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20 



25 



30 



est calculee a partir des modeles du SRI et de la 
« ligne moyenne ». 

Le pre-egaliseur 23 ayant la reponse f requentielle 
representee sur la figure 5 est realise par exemple par 
un filtre a reponse impulsionnelle infinie IIR, dont 
les coefficients de la fonction de transfert en z 
sont : 



Numerateur 



8. 357520e-01 
1 . 944621e+00 
2 . 247399e+00 
2. 882034e+00 
3 . 790301e+00 
3.916370e+00 
3 . 620913e+00 
3 . 232284e+00 
2 . 791610e+00 
210916e+00 
427630e+00 
8. 180893e-01 
4 . 847486e-01 
2 . 374002e-01 
5. 687199e-02 
3.475183e-03 



•2 

1. 



Denominateur 



1 . 000000e + 00 
-2 . 656995e+00 

3 . 127040e+00 
-3 . 674273e+00 

5 . 010501e+00 
-5. 330515e+00 

4 . 806031e+00 
••4 . 273201e + 00 

3 . 722987e + 00 
-2 . 9805.53e+00 

1.934353e+00 
-1.067379e+00 

6.378973e-01 
-3.3?2772e-01 

8.981179e-02 
-1 . 344099e-03 



Comme on vient de le voir, le pre-egaliseur 23 
compense des conditions moyennes de transmission. 

II peut etre utilise seul . Cependant s'il est 
utilise seul et qu'une des lignes analogiques est 
longue, la voix parait assourdie a la reception. Si au 
contraire une ligne est tres courte, les composantes 
haute frequence sont trop presentes. D'autres 
distorsions du timbre peuvent apparaitre si les 
systemes d' emission et de reception ont des reponses 
f requentielles trop eloignees des specifications de 
l'UIT. C'est pourquoi la pre-egalisat ion est completee 
par un egaliseur adapte, qui adapte la correction de 
maniere plus precise aux conditions reelles de 
transmission . 
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L'egaliseur est conqru pour que sa reponse 
f requentielle s # adapt e automat iquement a la distorsion 
reelle introduite par la liaison telephonique en 
fonction du rapport entre un spectre de reference et le 
spectre a long- tertne du signal. 

Le principe en est le suivant : 

Soient s le signal de parole emis par le locuteur, 
y le signal regu en bout de chaine, et h le filtre 
constitue par le canal analogique complet (emission et 
reception) et le pre-egaliseur . 

D'apres la formule des interferences, 

y y (f)= | H(f) | 2 . y s (f), (3) 

ou y s est la densite spectrale de puissance de s, y y 
celle de y et H la reponse f requentielle de h. 

Si le canal est suppose invariant dans le temps, 



designe la moyenne. Comme E[y s (f)} n'est pas connu, on 
1'approche par le spectre moyen de la parole defini par 
1UIT, que l'on appelle spectre de reference note y re f(f). 
Ainsi on estime la reponse f requentielle du filtre 

par : 



La reponse f requentielle de l'egaliseur adapte a 
alors pour expression : 




(5) 
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Comme I'egaliseur est centralise dans le reseau, y y 
n'est pas connu. On l'exprime en fonction de y x densite 
spectrale de puissance de la sortie x du pre- 
egalisateur, dans le cas ou il n'y aurait pas 
d' egalisateur -adapte, : 

r y Lf)=\L„m/t\sj<x(tf . /x (/), (7) 

ou L_RX est la reponse f requentielle de la ligne de 
reception et S_RX la reponse f requentielle du systeme 
de reception. Comme ces reponses sont inconnues a 
priori, on les approche par les reponses d'une ligne 
moyenne et d'un systeme de reception respectant la 
specification de 1'UIT, et notees respect ivement L_RXo 
et SJRXo. La reponse f requentielle de 1 ' egalisateur 
adaptee recherchee est alors : 

\EQ(f)\ = - t 1 ( /rg/(/) (8) 

' ' \S_RXo{f).L_RXo{f)\iE[y x {f)Y 

On voit dans cette formule que la racine carree du 
spectre de reference y re f est pondere par le facteur de 
compensation A(f) du fait de la correction deja 
effectuee par le pre-egaliseur . Ce facteur est fonction 
de la frequence comme indique ci-dessous : 



\S _ RXo (f).L _ RXo (f)\ 

Dans une realisation preferee, la sortie du pre- 
egaliseur 23 est analysee par trames de 32 ms, avec un 
recouvrement de 50 %. 

L'egaliseur 24 adapte est un filtre RIF 251 dont 
les coefficients sont adaptes a chaque trame d'activite 
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vocale selon 1' equation (8) ., comme decrit ci-apres et 
represents sur la figure 7. 

• Un detecteur de trames d'activite vocale 240 permet 
de declencher une chaine de traitements correspondant 
aux modules fonctionnels references 241 a 251 sur la 
figure 7 pour obtenir les coefficients du filtre 251. 

Une fenetre d' analyse du signal echantillonne 241 
est ouverte. Une transformee de Fourier -242 est 
appliquee sur les echantillons . 

Typiquement, mais non exclusivement , le spectre a 
long terme de x, E[y x ], est d'abord calcule a partir de 
1' instant initial d'activite vocale) par moyennage 244 
de Yx sur une fenetre temporelle croissant de 0 a 4 
secondes, puis ajuste recursivement a chaque trame 
suivante, ce qui se traduit par la fortnule generique 
suivante : 

E[Yx(f)]n = a(n)Y x (f,n) + (l-a(n))E[y x (f )]„-i. (9) 

ou E[Yx(f)]n est le spectre a long terme de x a la n ieme 
trame y x (f,n) la densite spectrale de puissance de la 
nieme trame, et 

mm{n,N) 

ou N est le nombre de trames dans 4 secondes. 

En pratique y x est calcule en prenant le module au 
carre de la transformee de Fourier rapide 242 sur la 
figure 7. 

La reponse f requentielle de l'egaliseur 24 est done 
calculee selon 1' equation (8) pour les frequences 
comprises entre F c et F H( le choix ayant ete fait de 
n'egaliser le signal que sur cette bande . 
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Les valeurs de |EQ| hors de cette bande de 
frequences sont calculees - de maniere connue par 
extrapolation lineaire 247 de la valeur en dB de |EQ| [FC - 

FH] ■ 

5 La reponse impulsionnelle - de 1'egaliseur est 

calculee par une transformee de Fourier inverse IFFT 
248 de |EQ| suivie d'une symetrisation 249, de maniere 
a obtenir un filtre a phase lineaire. 

La reponse f requentielle de ce filtre f est 

10 cependant tres irreguliere et, du fait des 
approximations qui ont entache son calcul, seule sa 
forme generale est pertinente. 

C'est pourquoi on procede a un etroit fenetrage 
symetrique 250 de la reponse impulsionnelle issue des 

15 operations 248 {transformee de Fourier inverse) et 249 
(symetrisation) . Ce fenetrage correspond a un lissage 
de la reponse f requentielle du filtre. 

Le fenetrage est suivi d'un decalage de maniere a 
obtenir un filtre de la longueur de la fenetre, sans 

2 0 retard supplementaire . 

On utilise pour cela par exemple une fenetre 
triangulaire de longueur 11 (echantillons) , dont les 
coefficients sont represerites sur la figure 6 pour une 
reponse impulsionnelle initiale sur 256 points. Une 

25 fois multipliee par cette fenetre, la reponse 
impulsionnelle de l'egaliseur adapte est decalee de 123 
points vers la gauche. Ceci permet de ne pas retarder 
le signal ce qui serait le cas si les zeros devant la 
fenetre intervenaient dans le calcul de la sortie du 

30 filtre. 

On procede alors ensuite a un controle automatique 
de gain. Ce controle a typiquement l'un ou 1' autre des 
deux objectifs suivants: 
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- normaliser le niveau, 

- assurer la transparence du dispositif vis-a-vis 
du niveau global- de parole a la reception. 

Deux realisations sont proposees dans la suite 
cor respondant respect ivement a ces deux objectifs. 

Dans une premiere realisation le controle de gain 
est realise par l'egaliseur adapte 24. Le choix de y re f 
correspond en ef fet a . un niveau nominal souhaitable 
pour la parole. Ainsi, suivant le niveau choisi pour 
Yref/ l'egaliseur adapte corrige automat iquement le 
niveau de parole pour atteindre le niveau souhaite en 
reception. 

Le but de la deuxieme realisation est de corriger 
le timbre tout en assurant une conservation du niveau 
global de la parole par rapport a la meme liaison sans 
le dispositif. 

Pour cela, le spectre a long terme du signal de 
reception doit avoir la meme energie avec le dispositif 
que sans. On applique done a la sortie de l'egaliseur 
24 adapte le gain a defini par la formule theorique : 



255 

£ (/)! 

a = — s 

\ I E[r avec <*)] 

avec yavec(k) et y san s (k) densite spectrale de puissance du 
signal regu a la frequence discrete k, respect ivement 
avec et sans 1' ensemble pre-egaliseur 23 plus egaliseur 
adapte 24. Comme le canal est invariant dans le temps, 
l'egaliseur adapte converge vers une reponse variant 
peu de sorte qu'a chaque trame : 

E [yavec (k) ] = | EQiis. (k) 1 2 1 SJiXo (k) 1 2 I L-RXo (k) | 2 E [y x (k) ] (11) 
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ou 



EQn 



SS 



est - la reponse 



f requentielle de 



l'egaliseur adapte pour la trame courante. 

Cependant', fEQii SS | n'est pas connu directement, 
puisque le lissage de la reponse f requentielle de 
l'egaliseur est effectue par un fenetrage de la reponse 
impulsionnelle issue de | EQ | . Comme la quantite |EQ| 
est directement disponible (calculee dans le module 
d' egalisation adapt^e) , pour simplifier la realisation, 
on approche |EQii SS | par A,|EQi iss |, A, etant un facteur de 
correction de la difference d'energie entre | EQii SS | et 
|EQ| liee au fenetrage de la reponse impulsionnelle. Si 
l'on note W la reponse f requentielle de la fenetre, 



ou ® designe la convolution circulaire et N le nombre 
de points de la FFT, 256 par exemple, |EQ| etant tres 
irregulier, si on l'assimile a du bruit, 



EQi iss (k)= ^EQ(k)®W(k) 

/Y 



(12) 



E[|EQi i8B (k) | 2 ] = 



i.E[|EQ(k) | 2 ) t W(k) 2 =E[|EQ(k) | 2 ]. f w(n) 2 (13) 




w designant la fenetre temporelle. Ainsi, 




(14) 



Pour une fenetre triangulaire de longueur 11, 1=2 . 
D' autre part, 
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Ety S ans(k) ] = 



S_RX 0 (k)\ 2 \L_RX 0 (kf 
\PRE_EQ(kf 



E[y x (k)] 



(15) 



ou Yx(k) est la densite spectrale de puissance de la 
sortie du pre-egaliseur et PRE_EQ(k) la reponse 
f requentielle du pre-egaliseur. 

Ainsi, 



a = 



\ 



2» \s_RX 0 (ktf\L_RX 0 (k) 



*=0 



\PRE-EQ(ktf 



E\r x (k)] 



|> J 1 EQ(k) | 2 | S_RX 0 (k) | J | L_RX c (k) | 2 Efo (k)] 



(16) 



Le gain est done calcule avec une complexite 
reduite, puisque E[y x (k)] et |EQ(k) | sont deja calcules 
dans le module d' egalisation adaptee et les autres 
facteurs sont des constantes. 

Si F c est trop faible, le signal recu est affecte 
d'un fort bruit de quantification. En effet, comme 
1' attenuation du systeme de reception est d' autant plus 
forte que la frequence est faible et que, legalisation 
cbmpensant cette attenuation sur la bande Fc-Fh, est 
placee avant le systeme de reception, cette egalisation 
anticipee induit a la sortie du dispositif des 
differences de niveau entre les composantes hautes et 
basses frequences d'autant plus grandes que F c est 
faible. Ainsi, pour certains phonemes, le niveau du 
bruit de quantification lors de la conversion en loi A 
est proche de celui des composantes medium et aigues. 
Apres 1' attenuation des composantes BF par le systeme 
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de reception, le bruit pergu a la reception est aussi 
energetique que le signal de parole. 

* Dans une realisation typique on a choisi : 
F c = 250Hz, ce qui permet un compromis acceptable 
5 entre la restauration des composantes BF et la 
limitation du bruit de quantification. 

Pour tous les locuteurs qui ont ete testes, le 

timbre de la voix a la reception est nettement plus 
10 proche de 1' original avec la correction par le 

dispositif presente que sans dispositif . 

Le temps d' adaptation de l'egaliseur est tres 

rapide : une amelioration du timbre est perceptible en 

moins d'une seconde et une estimation stable de 
15 l'egaliseur est obtenue en moins de 4 secondes pour la 

plupart des locuteurs. 

La figure 8 presente pour deux locuteurs la 

distorsion spectrale entre le signal de parole regu et 

le signal original au bout de 4 secondes de parole, 
20 dans le cas d'une liaison composee d'un SRI conforme a 

l'UIT, d'une ligne longue a 1' emission et d'une ligne 

moyenne a la reception. 

Une distorsion nulle serait representee par une 

courbe plate moyenne ( +++) sur toute la bande de 
2 5 frequences, a -9dB environ si 1'on ne modi fie pas le 

niveau- de reception par rapport au systeme sans 

correction. 

La distorsion est representee dans trois cas : sans 
correction (tirets) , avec pre-egaliseur seul 
30 (pointilles fins) et avec le dispositif complet (trait 
plein) . La courbe dans ce dernier cas n'est pas 
completement plate sur la bande egalisee (250-3150 Hz), 
mais les ecarts sont inferieurs a 2,5 dB, ce qui est 
peu perceptible. La correction de niveau est ici 
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realisee selon la deuxieme methode (conservation du 
niveau global) . 
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REVENDICATIONS 



1. Precede de correction du timbre de la parole 
transmise sous la forme d'un signal au moyen d'une 
liaison de transmission d'un reseau telephonique , la 
correction ayant lieu apres la conversion analogique- 

5 numerique du signal dans le reseau, caracterise en ce 
qu'il comprend au moins une etape de pre-egalisation du 
signal numerique par un filtre fixe ayant une reponse 
frequentielle dans une bande de frequences Fc-Fh 
correspondant a 1' inverse d'une deformation spectrale 
10 de reference introduite par la liaison telephonique, 
avec Fc < 300Hz et Fh > 3150Hz. 

2. Precede de correction du timbre de la parole 
selon la revendication 1, caracterise en ce que la 

15 deformation spectrale prise comme reference est 
caracterisee, pour une liaison du reseau de telephonie 
commutee (RTC) , a partir de la mise en cascade d'un 
systeme de reference intermediate (SRI) du type defini 
par la recommandation UIT-T P. 48, et de deux lignes 

2 0 analogiques moyennes (emission et reception) . 

3. Procede de correction du timbre de la parole 
selon la revendication 1, caracterise en ce que la 
deformation spectrale prise comme reference est dans le 

25 cas ou le terminal emetteur est un telephone mobile et 
le terminal recepteur est un poste fixe, celle 
resultant de la mise en cascade d'un filtre respectant 
le gabarit d'efficacite des mobiles en emission defini 
par la recommandation P. 313 de l'UIT, d'une ligne 
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analogique moyenne et d'un systeme de recepteur du SRI 
tel que defini par la recommandation UIT-TP.48. 

4 . Procede de correction du timbre de la parole 
5 selon la revendication 1, caracterise en ce que la 
deformation spectrale prise comme . reference est, dans 
le cas ou le terminal emetteur est un poste fixe et le 
terminal recepteur est un telephone mobile, celle 
resultant de la mise en cascade d'un systeme emetteur 
10 du SRI tel que defini par la recommandation UIT-TP.48, 
d'une ligne analogique moyenne et d'un filtre 
respectant le gabarit d'efficacite des mobiles en 
reception defini par la recommandation P. 313 de l'UIT. 

15 5. Procede de correction du timbre de la parole 

selon la revendication 1, caracterise en ce que la 
deformation spectrale prise comme reference est, dans 
le cas d'une liaison entre terminaux mobiles, celle 
resultant de la mise en cascade d'un filtre respectant 

20 le gabarit d'efficacite des mobiles en emission defini 
par la recommandation P. 313 de l'UIT et d'un filtre 
respectant le gabarit d'efficacite des mobiles en 
reception defini par la recommandation P. 313 de l'UIT. 

25 6. Procede de correction du timbre de la parole 

selon 1 ' une quelconque des revendications precedentes , 
caracterise en ce que le filtre utilise est un filtre 
de type a reponse impulsionnelle infinie IIR. 

3 0 7. Procede de correction du timbre de la parole 

selon 1'une quelconque des revendications precedentes, 
caracterise en ce que la frequence basse Fc de la bande 
de filtrage du. filtre est de 1'ordre de 250Hz. 
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8. Procede de correction du timbre de la parole 
selon 1'une quelconque des revendications precedentes, 
caracterise en ce qu'il comporte en outre une etape 
d' egalisation adaptee dans laquelle on utilise un 

5 filtre ayanfc line reponse f requentielle adaptee 
automatiquement a la distorsion reelle introduite par 
la liaison telephonique en fonction du rapport entre un 
spectre de reference et un spectre correspondant au 
spectre a long terme du signal. 

10 

9. Procede de correction du timbre de la parole 
selon la revendication 8, caracterise en ce que 1' etape 
d' egalisation adaptee comprend : 

- la detection d'une activite vocale sur la ligne 
15 pour declencher un enchainement de traitements pour le 

calcul des coefficients du filtre numerique en fonction 
du rapport entre le spectre de reference et le spectre 
correspondant au spectre a long terme du signal, 

- la commande du filtre avec les coefficients 
20 obtenus et 1 ' actualisation desdits coefficients, 

- le filtrage du signal sortant du pre-egaliseur 
par ledit filtre. 

10. Procede de correction du timbre de la parole 
25 selon la revendication 9, caracterise en ce que 

1 r enchainement de traitements comprend : 

- le calcul du spectre a long terme du signal dans 
des fenetres temporelles successives se recouvrant 
par t ie 1 1 ement , 

30 - "le calcul du module de la reponse f requentielle 

de 1'egaliseur adapte sur la bande Fc-Fh en effectuant 
le rapport de la racine carree du spectre a long terme 
obtenu dans une fenetre temporelle a la racine carree 
du spectre de reference, la racine carree du spectre de 



2822999 

27 



reference etant compense a chaque frequence par un 
facteur predetermine A(f) . 

11. Procede de correction du timbre de la parole 
5 selon la revendidation 9 on 8, caracterise en ce que 

1 ' enchai nement de traitements comprend une 
extrapolation du module de la reponse f requentielle de 
l'egaliseur adapte, pour les frequences en dehors de la 
bande Fc~Fh, typiquement pour une bande 0-4000Hz. 

10 

12 . Procede de correction du timbre de la parole 
selon 1'une quelconque des revendications 9 a 11, 
caracterise en ce que 1 ' enchancement de traitements 
comprend le calcul de la reponse impulsionnelle du 

15 filtre numerique a partir du module de la reponse 
f requentielle de l'egaliseur adapte extrapole pour les 
frequences en dehors de la bande Fc-Fh. 

13. Procede de correction du timbre de la parole 
2 0 selon 1'une quelconque des revendications 8 a 12, 

caracterise en ce que le calcul du spectre du signal a 
long terme comprend une operation de transf ormee de 
Fourier rapide. 

25 14. Procede de correction du timbre de la parole 

selon 1'une quelconque des_ revendications 8 a 12, 
caracterise en ce. que le calcul de la reponse 
impulsionnelle du filtre consiste a calculer les 
coefficients du filtre en operant une transf ormee de 

30 Fourier inverse . sur la reponse f requentielle de 
l'egaliseur adapte, une symetrisation puis une 
operation^ assurant le . lissage de la reponse 
f requentielle . 
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15. Procede de correction du timbre de la parole 
selon la revendication - 14/ caracterise en ce que 
1' operation de lissage est effectuee par 1 ' application 
d'une fenetre ternporelle sur la reponse impulsionnelle . 

5 

16. Procede de correction du timbre de la parole 
selon 1'une quelconque des revendications 8 a 15, 
caracterise en ce que le calcul du spectre a long terme 
du signal dans des fenetres temporelles successives se 

10 recouvrant partiellement comprend : 

- 1' echantillonnage du signal dans une fenetre 
ternporelle, 

1' operation de transformee de Fourier rapide 
(FFT) du signal echantillonne, 
15 - le calcul de la densite spectrale de puissance, 

- le calcul de la moyenne de la densite spectrale 
de puissance, sur une duree predeterminee . 

17. Procede de correction du timbre de la parole 
20 selon la revendication 16, caracterise en ce que le 

calcul de la moyenne de la densite spectrale de 
puissance consiste : 

- pour les N premieres fenetres temporelles a 
partir de la detection de presence de parole 

25 dans le signal, a calculer la moyenne 

arithmetique des densites spectrales de 
puissance de toutes les fenetres temporelles 
ecoulees depuis ladite detection, N etant un 
iidmbre de fenetre temporelles predetermine, 

30 typiquement mais non exclusivement le nombre de 

fenetres temporelles dans 4 secondes de parole ; 

- pour les fenetres temporelles suivantes, a 
ajuster la moyenne de la densite spectrale de 
puissance calculee a la fenetre ternporelle 
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precedente par un lissage recursif du premier 
ordre tenant compte de la densite spectrale de 
puissance de la fenetre temporelle courante. 

5 18. Procede de correction du timbre de la parole 

selon 1'une quelconque des revendications 8 a 17, 
caracterise en ce qu'il comprend une etape de controle 
automat ique du gain. 

10 19. Procede de correction du timbre de la parole 

selon la revendication 18, , caracterise en ce que le 
controle automatique du gain est realise durant 
1' enchainement des traitements de 1' etape d' egalisation 
adaptee en choisissant une densite spectrale de 

15 reference y re f correspondant au niveau souhaite en 
reception . 

20. Procede de correction du timbre de la parole 
selon la revendication 18 , caracterise en ce que le 

20 controle automatique du gain est realise par 
amplification du signal obtenu apres egalisation 
adaptee avec un gain a fonction du rapport entre la 
densite spectrale de puissance du signal de reception 
lorsque l'on a effectue une pre-egalisation et une 

25 egalisation adaptee du signal et, la densite spectrale 
. de puissance du signal en 1' absence de pre-egalisation 
et d' egalisation du signal. 

21. Filtre numerique fixe destine a la correction 
30 du timbre de la parole dans un reseau de transmission 

telephonique, caracterise en ce qu'il a une reponse 
f requentielle dans une bande de frequences Fc-Fh 
correspondant a 1' inverse d'une deformation spectrale 
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de reference introduite par la liaison telephonique, 
avec Fc < 300Hz et Fh > 3150Hz. 

22. Filtre numerique adapte destine a la correction 
5 du timbre de da parole dans un reseau de transmission 

telephonique, caracterise en ce qu'il comprend des 
moyens de traitement du signal de parole ayant une 
reponse f requentielle adaptee automat iquement a la 
distorsion reelle introduite par la liaison 
10 telephonique en fonction du rapport entre un spectre de 
reference et un spectre correspondant au spectre a long 
terme du signal. 

23. Dispositif de correction du timbre de la parole 
15 dans un reseau de transmission telephonique, 

caracterise en ce qu'il comprend un filtre fixe selon 
la revendication 20 suivi d'un filtre adapte selon la 
revendication 21 et des moyens de controle automatique 
du gain. 

20 

24. Dispositif de correction du timbre de la parole 
dans un reseau de transmission selon la revendication 
23, caracterise en ce que les moyens de controle 
automatique du gain sont realises par le filtre adapte. 

25 

25. Dispositif de correction du timbre de la parole 
dans un reseau de transmission selon la revendication 
23, caracterise en ce que les moyens de contrSle 
automatique du gain sont realises un amplif icateur du 

30 signal de gain a fonction du rapport entre la densite 
spectrale de puissance du signal de reception lorsque 
1'on a effectue une pre-egalisation et une egalisation 
adaptee du signal et, la densite spectrale de puissance 
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du signal en 1' absence de 
d' egalisation adaptee du signal. 

5 



pre- egalisation et 
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